12 research outputs found
Optical maps in guided genome assembly
With the introduction of DNA sequencing over 40 years ago, we have been able to take a peek
at our genetic material. Even though we have had a long time to develop sequencing strategies
further, we are still unable to read the whole genome in one go. Instead, we are able to gather
smaller pieces of the genetic material, which we can then use to reconstruct the original genome
with a process called genome assembly. As a result of the genome assembly we often obtain multiple
long sequences representing different regions of the genome, which are called contigs. Even though
a genome often consists of a few separate DNA molecules (chromosomes), the number of obtained
contigs outnumbers them substantially, meaning our reconstruction of the genome is not perfect.
The resulting contigs can afterwards be refined by ordering, orienting and scaffolding them using
additional information about the genome, which is often done manually by hand. The assembly
process can also be guided automatically with the additional information, and in this thesis we are
introducing a method that utilizes optical maps to aid us assemble the genome more accurately. A
noticeable improvement of this method is the unification of the contigs, i.e. we are left with fewer
but longer contigs. We are using an existing genome assembler called Kermit, which is designed
to accept genetic maps as auxiliary long range information. Our contribution is the development
of an assembly pipeline that provides Kermit with similar kind of information via optical maps.
The initial results of our experiments show that the proposed genome assembly scheme can take
advantage of optical maps effectively already during the assembly process to guide the reconstruction
of a genome
Towards Data-Driven Generation of Visualizations for Automatically Generated News Articles
Peer reviewe
Tekoälyn ja robotiikan hyödyntäminen Verohallinnon laadunvalvonnan prosesseissa
Tämän opinnäytetyön tavoitteena oli selvittää miten tekoälyä ja robotiikkaa voitaisiin hyödyntää laadunvalvonnassa ja -hallinnassa. Työssä kartoitetaan tekoälyn ja robotiikan hyödyntämisen nykytilaa ja tutkitaan minkälaisia sovellutuksia markkinoilta löytyy. Tekstissä perehdytään myös sovellusten jalostamiseen nimenomaan laadunvalvonnan ja -hallinnan käyttöön. Verohallinto toimi työssä yhteistyökumppanina ja työssä sivutaan myös sitä, kuinka tekoälyä ja robotiikkaa voisi käyttää nimenomaisesti heidän laadunvalvonnassaan ja laadunhallinnassaan. Työn teoriaosassa avataan työn keskisiä käsitteitä kuten tekoäly, robotiikka, laadunvalvonta ja laadunhallinta.
Tutkimus toteutettiin kvalitatiivisena tutkimuksena. Työssä käytettävä aineisto kerättiin pääosin internetin välityksellä ja kirjallisuudesta. Lisäksi Verohallinto tarjosi omia materiaalejaan laadunvalvontaan ja -hallintaan liittyen. Tutkimuksessa selvitettiin tekoälyn ja robotiikan käyttöä laadunvalvonnassa ja -hallinnassa tänä päivänä. Lisäksi tehtiin vertailua eri tekoälykategorioita edustavien tekoälysovellusten välillä. Vertailun tarkoituksena oli osoittaa ohjelmistojen eroja ja niiden soveltumista laadunvalvonnan ja -hallinnan tehtäviin. Tutkimuksen loppuun luotiin vielä katsaus siihen, miten Verohallinto voisi käyttää tekoälyä laadunvalvonnan ja -hallinnan prosesseissaan. Verohallinnolle annettiin myös ehdotelma seuraavista toimenpiteistä, joiden avulla tekoälytoimintoja voitaisiin saada integroitua laadunvalvonnan ja -hallinnan prosesseihin.
Tutkimuksen lopputuloksena selvisi, että tekoälyn ja robotiikan ratkaisuja laadunvalvontaan ja -hallintaan on kyllä olemassa, mutta ne ovat keskittyneet aineellisten tuotteiden laadunvalvontaan. Aineettomille asioille kuten palvelut, asiakasviestintä ja asiakaskirjaukset ei kuitenkaan löydetty tekoäly ratkaisuja. Tämä voi johtua siitä, että niitä ei ole tai siitä, että ne ovat sisäisessä käytössä eikä tietoa niiden käytöstä ole jaettu organisaatioiden ulkopuolelle. Tutkimuksen loppuun kuvattiin myös ehdotelma Verohallinnolle siitä, kuinka he voisivat hyödyntää tekoälyä ja robotiikkaa omissa laadunvalvonnan ja -hallinnan prosesseissaan. Lisäksi tutkimuksen avulla selvisi mitkä olemassa olevat tekoälysovellukset voisivat olla heidän käyttöönsä sopivimpi
Virtaveden virtausnopeusmittarin suunnittelu
Tässä työssä suunnitellaan virtaveden virtausnopeusmittari. Virtaveden eli painovoiman vaikutuksesta virtaavan veden mittaus on ajankohtaista, koska ilmaston lämpeneminen aiheuttaa muutoksia vesistöihin. Virtausnopeutta mitataan mm. joen virtaaman, eli ajan suhteen joen poikkipinta-alan läpi kulkeman tilavuuden, selvittämiseksi. Virtausnopeutta voidaan tarvita myös jalostamattomassa muodossa. Suunniteltava laite perustuu Pitot-putkeen, ja työssä arvioidaan, voiko se olla vaihtoehto nykyisille mittalaitteille. Pitot-putken historia alkaa virtaveden virtausnopeuden mittaamisesta, mutta nykyisin sitä käytetään nopeusmittarina esimerkiksi lentokoneessa tai formula-autossa. Pitot-putken katoamiselle sen alkuperäisestä käyttötarkoituksesta ei löytynyt selkeää syytä.
Työn kirjallisuuskatsauksessa kerättiin tietoa Pitot-putkesta, muista mittalaitteista, virtavedestä ja sen mittaamisesta. Mittalaitteen suunnittelu tehtiin Pahl et. al. systemaattisen lähestymistavan tuotekehitysmetodin mukaan. Lopputuloksena saatiin CAD-malli uudenlaisesta Pitot-putkeen perustuvasta virtausnopeusmittarista. Vaikka suunnitellun mittalaitteen Pitot-putken rakenne on paljolti samanlainen Henry Darcyn vuoden 1858 version kanssa, työn mittalaitteessa on myös uusia elementtejä. Yksi niistä on kelluva mitta-asteikko, joka poistaa tarpeen perinteisesti käytetylle staattiselle putkelle. Toinen on järjestelmä, joka sulkee veden Pitot-putkeen ja lukitsee mitta-asteikon luotettavan mittaustuloksen saamiseksi.
Pitot-putken rajoite on sen koko, koska mitä suurempi virtausnopeuden mittausväli halutaan, sitä pidempi putken täytyy olla. Työssä suunnitellulla mittalaitteella voidaan mitata virtausnopeuksia välillä 0–3,7 m/s, mikä riittää useimpiin käyttökohteisiin. Toinen Pitot-putkelle ominainen rajoite on, että mitta-asteikkoa ei voida esittää nopeutena, koska silloin merkintöjen välit eivät ole koko matkalta samanpituiset. Jatkotutkimuksena tehtäisiin prototyyppi, jotta mittalaitteen omi-naisuuksia voitaisiin luotettavasti arvioida
Monitehtäväinen liittoumaoppiminen datasettien verkostossa
Federated learning allows a network of clients to train a single model together without exchanging their private data. Multi-task learning allows multiple models learning distinct but related tasks to guide each other through parameter sharing. We combine these into a single approach, where a network of clients train their own deep neural networks in a multi-task learning setting without exchanging data. The task relatedness between clients is assumed to be known a priori.
We formulate the approach as an optimization problem, and solve it using a designed gradient descent algorithm. Both centralized and distributed algorithms are given. Experiments of the optimization algorithm in simple cases show that the approach works, assuming that the parameter sharing is well designed and the hyperparameters well chosen. The challenges and possible remedies are discussed.Liittoumaoppiminen mahdollistaa yhteisen koneoppimismallin optimoimisen verkostoituneiden toimijoiden kesken ilman, että niiden omaa, yksityistä dataa tarvitsee jakaa. Monitehtäväoppiminen taas mahdollistaa useiden eri mallien yhtäaikaisen opettamisen eri tehtäviin siten, että mallit opastavat toinen toistaan parametrien jakamista hyödyntämällä. Me yhdistämme nämä kaksi yhdeksi lähestymistavaksi, jossa toimijoiden verkosto opettaa jokainen oman mallinsa monitehtäväoppimista hyödyntäen, mutta jakamatta henkilökohtaista dataa. Tehtävien samankaltaisuudet suhteessa toisiinsa oletetaan tunnetuiksi.
Esittelemme lähestymistavan optimointiongelmana, ja ratkaisemme sen käyttäen suunnittelemaamme gradienttimenetelmäalgoritmia. Esittelemme sekä keskitetyn että hajautetun version algoritmista. Yksinkertaisissa tapauksissa tehdyt kokeet osoittavat, että lähestymistapa toimii, kunhan parametrien jakaminen on hyvin suunniteltu sekä hyperparametrit ovat sopivia. Käsittelemme ratkaisun haasteita sekä mahdollisia parannuksia